智能论文笔记

SNPs Filtered by Allele Frequency Improve the Prediction of Hypertension Subtypes

Yiming Li , Sanjiv J. Shah , Donna Arnett , Ryan Irvin , Yuan Luo

分类：机器学习

2021-11-19

高血压是心血管疾病的主要原因和过早死亡。不同的高血压亚型可能在其预后变化，并且需要不同的治疗方法。个人的高血压风险由遗传和环境因素以及它们的相互作用决定。在这项工作中，我们研究了911名非洲裔美国人和1171名欧洲美国人在高血压遗传流行病学网络（Hypergen）Cohort中。我们使用环境变量和基于不同标准选择的遗传功能组建造的高血压子类型分类模型。拟合模型提供了洞察高血压亚型的遗传景观，这可能有助于未来的个性化诊断和治疗高血压。

translated by 谷歌翻译

Improving astroBERT using Semantic Textual Similarity

Felix Grezes , Thomas Allen , Sergi Blanco-Cuaresma , Alberto Accomazzi , Michael J. Kurtz , Golnaz Shapurian , Edwin Henneken , Carolyn S. Grant , Donna M. Thompson , Timothy W. Hostetler

分类：自然语言处理

2022-11-29

The NASA Astrophysics Data System (ADS) is an essential tool for researchers that allows them to explore the astronomy and astrophysics scientific literature, but it has yet to exploit recent advances in natural language processing. At ADASS 2021, we introduced astroBERT, a machine learning language model tailored to the text used in astronomy papers in ADS. In this work we: - announce the first public release of the astroBERT language model; - show how astroBERT improves over existing public language models on astrophysics specific tasks; - and detail how ADS plans to harness the unique structure of scientific papers, the citation graph and citation context, to further improve astroBERT.

translated by 谷歌翻译

BayesLDM: A Domain-Specific Language for Probabilistic Modeling of Longitudinal Data

Karine Tung , Steven De La Torre , Mohamed El Mistiri , Rebecca Braga De Braganca , Eric Hekler , Misha Pavel , Daniel Rivera , Pedja Klasnja , Donna Spruijt-Metz , Benjamin M. Marlin

分类：机器学习 | 人工智能

2022-09-12

在本文中，我们介绍Bayesldm，这是一个用于贝叶斯纵向数据建模的系统，该系统由高级建模语言组成，具有针对复杂的多变量时间序列数据建模的特定功能，并与编译器相结合，可以生成优化的概率程序代码，以在指定模型中执行指定的推理。 Bayesldm支持贝叶斯网络模型的建模，其特定关注动态贝叶斯网络（DBN）的高效，声明性规范。 Bayesldm编译器将模型规范与可用数据和输出代码相结合，用于执行贝叶斯推断，以同时处理丢失的数据，同时处理未知模型参数。这些功能有可能通过抽象产生计算有效的概率推断代码的过程来显着加速域中的迭代建模工作流，这些迭代建模工作流程涉及复杂纵向数据的分析。我们描述了Bayesldm系统组件，评估表示和推理优化的效率，并提供了该系统在分析异质和部分观察到的移动健康数据的应用示例。

translated by 谷歌翻译

PRIME: Uncovering Circadian Oscillation Patterns and Associations with AD in Untimed Genome-wide Gene Expression across Multiple Brain Regions

Xinxing Wu , Chong Peng , Gregory Jicha , Donna Wilcock , Qiang Cheng

分类：人工智能 | 机器学习

2022-08-25

昼夜节律的破坏是阿尔茨海默氏病（AD）患者的基本症状。人类脑中基因表达的完整昼夜节律编排及其与AD的固有关联仍然很大程度上是未知的。我们提出了一种新颖的综合方法，即Prime，以检测和分析在多个数据集中不合时宜的高维基因表达数据中的节奏振荡模式。为了证明Prime的实用性，首先，我们通过从小鼠肝脏中的时间课程表达数据集作为跨物种和跨器官验证来对其进行验证。然后，我们将其应用于研究来自19个对照和AD患者的19个人脑区域的未接收基因组基因表达中的振荡模式。我们的发现揭示了15对控制大脑区域中清晰，同步的振荡模式，而这些振荡模式要么消失或昏暗。值得注意的是，Prime在不需要样品的时间戳而发现昼夜节律的节奏模式。 Prime的代码以及在本文中复制数字的代码，可在https://github.com/xinxingwu-uk/prime上获得。

translated by 谷歌翻译

Object-Level Targeted Selection via Deep Template Matching

Suraj Kothawade , Donna Roy , Michele Fenzi , Elmar Haussmann , Jose M. Alvarez , Christoph Angerer

分类：计算机视觉

2022-07-05

在查询图像中检索与感兴趣的对象（OOI）在语义上相似的对象具有许多实际用例。一些示例包括修复失败，例如虚假的负面因素/阳性模型或减轻数据集中的类不平衡。有针对性的选择任务需要从大规模的未标记数据池中找到相关数据。在此规模上进行手动开采是不可行的。此外，OOI通常很小，占据图像区域的1％不到1％，被遮挡，并且在混乱的场景中与许多语义上不同的物体共存。现有的语义图像检索方法通常集中在较大尺寸的地理地标的采矿和/或需要额外的标记数据，例如带有相似对象的图像/图像对，用于带有通用对象的挖掘图像。我们在DNN功能空间中提出了一个匹配算法的快速稳固的模板，该模板从一个大的未标记数据池中检索了对象级的语义相似图像。我们将查询图像中OOI周围的区域投射到DNN功能空间以用作模板。这使我们的方法能够专注于OOI的语义，而无需额外的标记数据。在自主驾驶的背景下，我们通过将对象探测器的故障案例作为OOI评估我们的系统进行靶向选择。我们证明了其在具有2.2m图像的大型未标记数据集上的功效，并在采矿中显示出对具有小型OOI的图像的高回忆。我们将我们的方法与众所周知的语义图像检索方法进行比较，该方法也不需要额外的标记数据。最后，我们证明我们的方法是灵活的，并以一种或多种语义上不同的同时发生的OOI无缝地检索图像。

translated by 谷歌翻译

Semantic Search for Large Scale Clinical Ontologies

Duy-Hoa Ngo , Madonna Kemp , Donna Truran , Bevan Koopman , Alejandro Metke-Jimenez

分类：自然语言处理 | 机器学习

2022-01-01

当查询使用不同的词汇表时，在大型临床本体中寻找概念可能是挑战。一种克服这个问题的搜索算法在概念归一化和本体匹配之类的应用中有用，其中概念可以以不同的方式引用，使用不同的同义词。在本文中，我们提出了一种基于深度学习的方法来构建大型临床本体的语义搜索系统。我们提出了一种三重型BERT模型和一种直接从本体产生培训数据的方法。该模型使用五个真实的基准数据集进行评估，结果表明，我们的方法在自由文本上实现了高结果，以概念和概念到概念搜索任务，并且优越所有基线方法。

translated by 谷歌翻译

Building astroBERT, a language model for Astronomy & Astrophysics

Felix Grezes , Sergi Blanco-Cuaresma , Alberto Accomazzi , Michael J. Kurtz , Golnaz Shapurian , Edwin Henneken , Carolyn S. Grant , Donna M. Thompson , Roman Chyla , Stephen McDonald

分类：自然语言处理

2021-12-01

用于探索美国国家航空航天局的搜索工具（广告）可以相当丰富和赋予（例如，类似和趋势的运营商），但研究人员尚未允许完全杠杆语义搜索。例如，对“普朗克任务的结果”查询应该能够区分普朗克（人，任务，常量，机构和更多）的所有各种含义，而无需从用户进一步澄清。在广告中，我们正在将现代机器学习和自然语言处理技术应用于我们最近的天文出版物的数据集，以培训Astrobert，这是一种基于Google研究的深刻语境语言模型。使用AstrBert，我们的目标是丰富广告数据集并提高其可发现性，特别是我们正在开发自己的命名实体识别工具。我们在这里展示我们初步的结果和经验教训。

translated by 谷歌翻译

Dehumanizing Voice Technology: Phonetic & Experiential Consequences of Restricted Human-Machine Interaction

Christian Hildebrand , Donna Hoffman , Tom Novak

分类：人工智能

2021-11-02

使用自然语言和基于语音的界面Gradu-ally转换消费者搜索，商店和表达他们的喜好。目前的工作探讨了与会话接口交互的语法结构的变化（命令与基于请求的表达方式）对消费者的主观任务享受产生负面影响，并系统地改变人类声音的客观声音特征。我们表明请求（与命令）导致语音融合和更低的语音延迟的折扣，最终是消费者的更自然的任务经验。据我们所知，这是第一份工作文件，可以改变消费者如何与智能对象系统地影响消费者的物联网体验的输入方式。我们提供了改变所需输入，以启动与智能对象的对话引发系统的改变，这两者都在消费者的主观经验和人类声音的客观语音变化。目前的研究还通过突出人类语音中的特征提取的未开发潜力作为一种在语音形成期间与消费者的声音特征联系起来的新型数据格式以及他们的子行程任务经验来进行方法暗示。

translated by 谷歌翻译